Định nghĩa 10.1.1: Liên kết Thống kê
Hai biến $X$ và $Y$ được xem là có liên quan nếu có bất kỳ sự thay đổi trong phân phối điều kiện của $Y$, khi biết $X = x$, khi $x$ thay đổi. Ngược lại, trạng thái "không có mối quan hệ" là tương đương toán học với tính độc lập của $X$ và $Y$.
Các biến $X$ và $Y$ không liên quan nếu và chỉ nếu $f(y|x) = f(y)$ với mọi giá trị của $x$. Điều này ngụ ý rằng hàm tần suất tương đối đồng thời có thể được phân tích thành:
$$f(x, y) = f(x)f(y)$$
Do đó, kiểm tra mối quan hệ về cơ bản là một phép thử về Tính độc lập.
Cơ chế Thay đổi
Một mối quan hệ được xác định bởi bất kỳ sự dịch chuyển nào trong hàm mật độ điều kiện (như minh họa trong Hình 10.1.1). Điều này bao gồm:
- Dịch chuyển Trung bình: Giá trị kỳ vọng $E(Y|X)$ thay đổi (điểm tập trung phổ biến nhất).
- Dịch chuyển Phương sai: Độ rộng hoặc mức độ bất định của $Y$ phụ thuộc vào $X$ (phương sai thay đổi).
- Thay đổi Dạng hình: Phân phối tổng thể thay đổi (ví dụ: từ đối xứng sang lệch).
Thiết lập Nguyên nhân - Kết quả thông qua Thiết kế
Một mối quan hệ thống kê không ngụ ý nguyên nhân - kết quả. Để khẳng định rằng $X$ gây ra $Y$, chúng ta phải xem xét các biến gây nhiễu thông qua Thiết kế Thực nghiệm:
- Các nhóm Kiểm soát: Cung cấp một chuẩn mực để so sánh.
- Hiệu ứng Nước cờ: Giảm thiểu cảm giác cải thiện nhờ các phương pháp vô hiệu.
- Che giấu thông tin: Sử dụng các thí nghiệm mù (người nhận không biết) và các thí nghiệm hai chiều mù (cả người nhận và nhà nghiên cứu đều không biết) để loại bỏ thiên vị.
- Bố trí khối: Như đã thấy trong Ví dụ 10.1.7, chúng ta sử dụng các biến khối ($W$, ví dụ như độ phì nhiêu của đất) để đảm bảo mối quan hệ giữa loại lúa mì ($X$) và năng suất ($Y$) không bị ảnh hưởng bởi các điều kiện sẵn có.